La OVH subisce un duro colpo, incendio in un datacenter a Strasburgo
Un intero edificio della società francese è stato distrutto dalle fiamme. Ocurrió en el campus de OVH en Estrasburgo.
¿¿Qué pasó?
Alrededor de las 2 de la madrugada del 10 de marzo, uno de los cuatro edificios del centro de datos de OVH, SBG2 quedó envuelto en llamas. L’intero sito è stato isolato e questo ha implicato un blocco dei data center da SGB1 a 4.
Le riaperture di SGB1 e SGB4 sono programmate entro il prossimo 15 marzo, mentre SGB3 verrà ripristinato entro venerdì 19 marzo.
La compañía, a través de una nota de prensa, está actualizando progresivamente a sus clientes sobre el estado de la incidencia.
La intervención de los bomberos no pudo contener los daños, pero parece que no hubo víctimas. Aún no se ha establecido la causa del incendio, mientras que se ha iniciado una investigación por parte de las autoridades.
La interrupción repentina de las actividades ha causado bastantes problemas a los clientes del proveedor de servicios en la nube, que tiene más de un millón y medio de aplicaciones en sus centros de datos.
Caída de miles de sitios, buzones de correo inactivos, junto con las numerosas quejas de los usuarios en los perfiles sociales oficiales de la empresa, que piden una mayor asistencia técnica para amortiguar los diversos problemas. La empresa se ha mostrado dispuesta a intervenir con asistencia directa a los clientes, pero la situación sigue pareciendo inmanejable.
Cos’è il Disaster Recovery Plan?
A través de su perfil de Twitter, el fundador y CEO Octave Kabla instó a sus usuarios a activar el Plan de Recuperación de Desastres lo antes posible para hacer frente a la emergencia repentina.
El Plan de Recuperación ante Desastres Es un proceso relacionado con la preparación para la recuperación y continuidad de los servicios vitales de una empresa después de un evento natural o error humano. Consta de un conjunto de fases que incluyen:
- Ensayo: Después de instalar la solución de recuperación ante desastres, debe probarla. El «día del juego» es cuando se realiza una conmutación por error a su entorno de recuperación ante desastres.
- Supervisión y alertas: debe contar con auditorías periódicas y una supervisión suficiente para alertarle en caso de que su entorno de recuperación ante desastres se haya visto afectado por fallos del servidor, problemas de conectividad y problemas de aplicaciones.
- Backups: Una vez implementado el entorno de recuperación ante desastres, debe seguir realizando copias de seguridad periódicas. Las pruebas periódicas de copia de seguridad y recuperación son esenciales como solución alternativa.
- Acceso de usuarios: puede proteger el acceso a los recursos de su entorno de recuperación ante desastres mediante AWS Identity and Access Management (IAM).
- Automatización: puede automatizar la implementación de aplicaciones en servidores basados en AWS y servidores locales mediante software de administración de configuración.
Redundancia de datos
A destare preoccupazione e stupore è anche l’apparente assenza di una ridondanza dei dati, ovvero una progettazione dell’architettura dei server che ne replica il contenuto, garantendo la continua erogazione di un servizio anche se un impianto diventa inaccessibile.
In effetti tutti i dati che erano hostati sui data center che sono andati in fiamme non erano stati preventivamente sottoposti a backup.
Perché con AWS i tuoi dati sono al sicuro?
Uno de los puntos fuertes de AWS Es su infraestructura global en la nube. AWS tiene el ecosistema más grande, dinámico y seguro con millones de clientes activos y decenas de miles de socios en todo el mundo.
La red de AWS está organizada en regiones, que se definen como la ubicación física en el mundo donde se agrupan los centros de datos. Cada región se compone de una serie de zonas de disponibilidad que están aisladas y separadas físicamente dentro de una región geográfica.
Las zonas de disponibilidad permiten a los clientes ejecutar aplicaciones y bases de datos en entornos de producción con alta disponibilidad, tolerancia a errores y escalabilidad que, de otro modo, serían imposibles de lograr en un solo centro de datos.
Todas las zonas de disponibilidad de una región de AWS están interconectadas a través de una red de alto ancho de banda y baja latencia, a través de una fibra metropolitana dedicada totalmente redundante que distribuye redes de alto rendimiento y baja latencia entre ellas.
Todo el tráfico entre zonas de disponibilidad está cifrado. El rendimiento de la red es suficiente para lograr la replicación sincrónica entre zonas de disponibilidad. La partición de una aplicación en diferentes zonas de disponibilidad permite aislar a las empresas y protegerlas de problemas como apagones, rayos, tornados, terremotos, etc.
Las zonas de disponibilidad están separadas físicamente entre sí por una distancia significativa de muchos kilómetros, mientras que permanecen dentro de los 100 km entre sí.
Alta disponibilidad
A diferencia de otros proveedores de infraestructura tecnológica, cada región de AWS tiene diferentes zonas de disponibilidad. Las zonas de disponibilidad están conectadas entre sí con redes privadas de fibra óptica ultrarrápidas, lo que permite a los clientes diseñar aplicaciones que conmutan por error a varias zonas sin interrupción.
El plano de control de AWS y la consola de administración de AWS se implementan en todas las regiones de AWS y utilizan una arquitectura multi-AZ dentro de cada región para proporcionar resiliencia y garantizar la disponibilidad continua.
Esto garantiza que los clientes eviten dependencias de servicios críticas en un solo centro de datos. Puede llevar a cabo actividades de mantenimiento sin que un servicio crítico para el cliente deje de estar disponible temporalmente.
Continuidad mejorada
Además de replicar aplicaciones y datos en diferentes centros de datos dentro de una sola región mediante zonas de disponibilidad, también puede lograr una mayor redundancia y tolerancia a errores mediante la replicación de datos en varias regiones de AWS.
Puede utilizar tanto redes privadas de alta velocidad como conexiones públicas a Internet, lo que mejora aún más la continuidad del negocio y mantiene la baja latencia bajo control en todo el mundo.
¿Qué hace VMEngine para proteger a sus clientes?
A raíz de un evento tan dramático, hay muchas preguntas sin respuesta sobre cuánto se podría haber predicho un evento de esta magnitud.
El caso es que las consecuencias (inesperadas) han hecho que se hable mucho más del evento en sí, solo hay que pensar en la cantidad de usuarios que tendrán que esperar hasta la semana que viene para volver a la normalidad.
¿Se podría haber evitado? ¿Puede proteger su infraestructura de accidentes o errores humanos? ¿La nube es siempre una certeza?
A continuación se muestran algunos de los casos de éxito de VMEngine que han explotado el potencial de uno de los principales proveedores de nube del mundo y, con la ayuda de los arquitectos especializados de AWS, han creado infraestructuras ad hoc al tiempo que han adoptado todas las soluciones para salvaguardar sus datos y arquitecturas.